Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Reconnaissance de tables de matières. Le projet TDM

Identifieur interne : 00B418 ( Main/Exploration ); précédent : 00B417; suivant : 00B419

Reconnaissance de tables de matières. Le projet TDM

Auteurs : Abdel Belaïd [France] ; F. Parmentier [France]

Source :

RBID : Pascal:99-0276785

Descripteurs français

English descriptors

Abstract

Cet article présente une méthode de reconnaissance automatique de tables de matières (sommaires) qui sont destinées à la consultation électronique de documents dans le projet Calliope. Les processus mis en œuvre permettent, à partir du texte du sommaire obtenu par lecture optique de son image, de localiser les différents articles du sommaire et d'extraire leurs différents champs: titre, auteur et numéro de pages. Ces champs sont ensuite utilisés comme index pour la recherche et la lecture des articles référencés dans le sommaire. Le prototype logiciel développé fonctionne de manière très satisfaisante sur des sommaires de formats très différents. Les performances s'élèvent à 98 % de bonne reconnaissance pour des Sommaires textuels appartenant à des revues scientifiques.

Url:


Affiliations:


Links toward previous steps (curation, corpus...)


Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr" level="a">Reconnaissance de tables de matières. Le projet TDM</title>
<author>
<name sortKey="Belaid, A" sort="Belaid, A" uniqKey="Belaid A" first="A." last="Belaïd">Abdel Belaïd</name>
<affiliation wicri:level="3">
<inist:fA14 i1="01">
<s1>LORIA-CNRS Campus scientifique B. P. 239</s1>
<s2>54506 Vandoeuvre-Lès-Nancy</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
</inist:fA14>
<country>France</country>
<placeName>
<region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
<settlement type="city">Vandœuvre-lès-Nancy</settlement>
</placeName>
<placeName>
<settlement type="city">Nancy</settlement>
<region type="region" nuts="2">Grand Est</region>
<region type="region" nuts="2">Lorraine (région)</region>
</placeName>
<orgName type="laboratoire" n="5">Laboratoire lorrain de recherche en informatique et ses applications</orgName>
<orgName type="university">Université de Lorraine</orgName>
<orgName type="institution">Centre national de la recherche scientifique</orgName>
<orgName type="institution">Institut national de recherche en informatique et en automatique</orgName>
</affiliation>
</author>
<author>
<name sortKey="Parmentier, F" sort="Parmentier, F" uniqKey="Parmentier F" first="F." last="Parmentier">F. Parmentier</name>
<affiliation wicri:level="3">
<inist:fA14 i1="01">
<s1>LORIA-CNRS Campus scientifique B. P. 239</s1>
<s2>54506 Vandoeuvre-Lès-Nancy</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
</inist:fA14>
<country>France</country>
<placeName>
<region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
<settlement type="city">Vandœuvre-lès-Nancy</settlement>
</placeName>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">INIST</idno>
<idno type="inist">99-0276785</idno>
<date when="1998">1998</date>
<idno type="stanalyst">PASCAL 99-0276785 INIST</idno>
<idno type="RBID">Pascal:99-0276785</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000B33</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000D37</idno>
<idno type="wicri:Area/PascalFrancis/Checkpoint">000B19</idno>
<idno type="wicri:explorRef" wicri:stream="PascalFrancis" wicri:step="Checkpoint">000B19</idno>
<idno type="wicri:doubleKey">1279-5127:1998:Belaid A:reconnaissance:de:tables</idno>
<idno type="wicri:Area/Main/Merge">00BB41</idno>
<idno type="wicri:source">HAL</idno>
<idno type="RBID">Hal:inria-00098498</idno>
<idno type="url">https://hal.inria.fr/inria-00098498</idno>
<idno type="wicri:Area/Hal/Corpus">006475</idno>
<idno type="wicri:Area/Hal/Curation">006475</idno>
<idno type="wicri:Area/Hal/Checkpoint">006796</idno>
<idno type="wicri:explorRef" wicri:stream="Hal" wicri:step="Checkpoint">006796</idno>
<idno type="wicri:doubleKey">1279-5127:1998:Belaid A:reconnaissance:de:tables</idno>
<idno type="wicri:Area/Main/Merge">00BC35</idno>
<idno type="wicri:Area/Main/Curation">00B418</idno>
<idno type="wicri:Area/Main/Exploration">00B418</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr" level="a">Reconnaissance de tables de matières. Le projet TDM</title>
<author>
<name sortKey="Belaid, A" sort="Belaid, A" uniqKey="Belaid A" first="A." last="Belaïd">Abdel Belaïd</name>
<affiliation wicri:level="3">
<inist:fA14 i1="01">
<s1>LORIA-CNRS Campus scientifique B. P. 239</s1>
<s2>54506 Vandoeuvre-Lès-Nancy</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
</inist:fA14>
<country>France</country>
<placeName>
<region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
<settlement type="city">Vandœuvre-lès-Nancy</settlement>
</placeName>
<placeName>
<settlement type="city">Nancy</settlement>
<region type="region" nuts="2">Grand Est</region>
<region type="region" nuts="2">Lorraine (région)</region>
</placeName>
<orgName type="laboratoire" n="5">Laboratoire lorrain de recherche en informatique et ses applications</orgName>
<orgName type="university">Université de Lorraine</orgName>
<orgName type="institution">Centre national de la recherche scientifique</orgName>
<orgName type="institution">Institut national de recherche en informatique et en automatique</orgName>
</affiliation>
</author>
<author>
<name sortKey="Parmentier, F" sort="Parmentier, F" uniqKey="Parmentier F" first="F." last="Parmentier">F. Parmentier</name>
<affiliation wicri:level="3">
<inist:fA14 i1="01">
<s1>LORIA-CNRS Campus scientifique B. P. 239</s1>
<s2>54506 Vandoeuvre-Lès-Nancy</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
</inist:fA14>
<country>France</country>
<placeName>
<region type="region" nuts="2">Grand Est</region>
<region type="old region" nuts="2">Lorraine (région)</region>
<settlement type="city">Vandœuvre-lès-Nancy</settlement>
</placeName>
</affiliation>
</author>
</analytic>
<series>
<title level="j" type="main">Document numérique</title>
<title level="j" type="abbreviated">Doc. numér.</title>
<idno type="ISSN">1279-5127</idno>
<imprint>
<date when="1998">1998</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<title level="j" type="main">Document numérique</title>
<title level="j" type="abbreviated">Doc. numér.</title>
<idno type="ISSN">1279-5127</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>Automatic recognition</term>
<term>Description</term>
<term>Digitizing</term>
<term>Electronic library</term>
<term>Information access</term>
<term>Information system</term>
<term>Optical character recognition</term>
<term>Software</term>
<term>Table of contents</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr">
<term>Accès information</term>
<term>Logiciel</term>
<term>Sommaire</term>
<term>Reconnaissance automatique</term>
<term>Description</term>
<term>Numérisation</term>
<term>Reconnaissance optique caractère</term>
<term>Système information</term>
<term>Bibliothèque électronique</term>
<term>CALLIOPE</term>
</keywords>
<keywords scheme="Wicri" type="topic" xml:lang="fr">
<term>Logiciel</term>
<term>Numérisation</term>
</keywords>
<keywords scheme="mix" xml:lang="fr">
<term>Calliope</term>
<term>OCR</term>
<term>TextBridge</term>
<term>reconnaissance de sommaires</term>
<term>summaries</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Cet article présente une méthode de reconnaissance automatique de tables de matières (sommaires) qui sont destinées à la consultation électronique de documents dans le projet Calliope. Les processus mis en œuvre permettent, à partir du texte du sommaire obtenu par lecture optique de son image, de localiser les différents articles du sommaire et d'extraire leurs différents champs: titre, auteur et numéro de pages. Ces champs sont ensuite utilisés comme index pour la recherche et la lecture des articles référencés dans le sommaire. Le prototype logiciel développé fonctionne de manière très satisfaisante sur des sommaires de formats très différents. Les performances s'élèvent à 98 % de bonne reconnaissance pour des Sommaires textuels appartenant à des revues scientifiques.</div>
</front>
</TEI>
<affiliations>
<list>
<country>
<li>France</li>
</country>
<region>
<li>Grand Est</li>
<li>Lorraine (région)</li>
</region>
<settlement>
<li>Nancy</li>
<li>Vandœuvre-lès-Nancy</li>
</settlement>
<orgName>
<li>Centre national de la recherche scientifique</li>
<li>Institut national de recherche en informatique et en automatique</li>
<li>Laboratoire lorrain de recherche en informatique et ses applications</li>
<li>Université de Lorraine</li>
</orgName>
</list>
<tree>
<country name="France">
<region name="Grand Est">
<name sortKey="Belaid, A" sort="Belaid, A" uniqKey="Belaid A" first="A." last="Belaïd">Abdel Belaïd</name>
</region>
<name sortKey="Parmentier, F" sort="Parmentier, F" uniqKey="Parmentier F" first="F." last="Parmentier">F. Parmentier</name>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Exploration
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 00B418 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Main/Exploration/biblio.hfd -nk 00B418 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Main
   |étape=   Exploration
   |type=    RBID
   |clé=     Pascal:99-0276785
   |texte=   Reconnaissance de tables de matières. Le projet TDM
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022